Arrastrar

Click

volver a inicio

Transcriptor de Audio con IA - Whisper

Categoría: Programación Tecnología: Python • Tkinter • OpenAI Whisper
🎙️

Básicamente, creé una app que convierte audio en texto usando IA. Porque, seamos honestos, escribir manualmente es para gente con paciencia infinita 😅

¿Qué hace exactamente? (La versión sin tecnicismos)

Metes un audio (MP3, WAV, M4A, lo que sea), le das al botón de "Transcribir" y boom 💥 — la IA te lo convierte a texto. Así de simple. Es como tener un secretario que nunca se cansa, nunca se equivoca (bueno, casi nunca) y que además te genera subtítulos para CapCut.

Ideal si eres creador de contenido, podcaster, periodista o simplemente alguien que graba audios pero no quiere pasarse 3 horas escribiendo lo que dijo 😂

Captura de pantalla de la interfaz del Transcriptor
Interfaz moderna (bueno es bastante fea pero sirve) y oscura del Transcriptor Whisper

Lo que hace especial (mis features favoritas 🎯)

✨ Interfaz que no duele a la vista: Diseño oscuro con colores neón (cyan, verde, púrpura). Porque trabajar 8 horas mirando un fondo blanco es tortura medieval 😤

🧠 5 modelos de IA para elegir: Desde "Tiny" (rápido pero básico) hasta "Large" (lento pero preciso). Es como elegir entre una moto y un camión — depende si tienes prisa o precisión 🏍️🚚

🌍 Detecta idiomas automáticamente: Le metes un audio en chino, español, inglés... y adivina. Si falla, le dices manualmente y listo. Es como tener un traductor que a veces se equivoca pero que no se ofende 😅

📝 Genera prompts para ChatGPT: No solo transcribe, sino que te crea un prompt listo para meter en ChatGPT. Perfecto para cuando quieres que la IA te resuma un video de 1 hora en 5 minutos ⚡

🎬 Crea subtítulos SRT: Genera archivos de subtítulos listos para CapCut. Así tus videos quedan con subtítulos sin que tengas que hacer nada. Magia pura ✨

💾 Exporta todo lo que quieras: TXT, prompts, SRT... lo que necesites. Es como tener un cajón donde cabe todo.

Cómo funciona (la magia detrás del telón 🎭)

Está hecho en Python con Tkinter para la interfaz. Básicamente es un script que no te congela la pantalla mientras procesa (cosa que aprendí a la mala 😅). El flujo es así:

1️⃣ Seleccionar archivo: Haces clic en "Examinar" y buscas tu audio. Puede ser MP3, WAV, lo que sea. Si intentas meter un PDF, te lo rechaza 😂

2️⃣ Configurar: Eliges qué modelo quieres (¿rápido o preciso?), el idioma, y cuánto tiempo quieres que dure el resumen. Aquí es donde jugas a ser ingeniero 🔧

3️⃣ Procesar: Le das al botón "Transcribir" y la IA se pone a trabajar. Todo en un thread separado para que la interfaz no se quede congelada como un popsicle 🍦 Ves una barra de progreso bonita que te dice "tranquilo, estoy en ello"

4️⃣ Resultados: Boom 💥 — aparece el texto transcrito. Puedes copiar, generar un prompt para ChatGPT, o simplemente admirar tu obra maestra.

5️⃣ Guardar: Exportas como TXT, SRT o lo que necesites. Todo listo para usar en CapCut, Word, o donde sea. Misión cumplida 🎉

Diagrama del flujo de trabajo
Aqui se hace la magia 😎

Con qué lo hice (el stack técnico 🛠️)

🐍 Python: El lenguaje que elegí porque es como el español de la programación — fácil de leer y muy versátil.

🎨 Tkinter: La librería para hacer la interfaz. Básicamente es lo que te permite ver botones bonitos en lugar de solo código en la terminal.

🤖 OpenAI Whisper: La IA que hace toda la magia. Es el cerebro del programa. Sin esto sería solo un botón que no hace nada 😅

⚙️ Threading: La cosa que hace que mientras procesa el audio, la interfaz no se quede congelada. Aprendí esto después de sufrir 😂

🎨 Colores neón personalizados: Porque la vida es demasiado corta para interfaces feas.

¿Para quién es esto? 👥

Creadores de TikTok/YouTube: Graba un video, transcribe, genera subtítulos, sube. Boom. Contenido listo 🚀

Periodistas/Reporteros: Entrevista a alguien, transcribe automáticamente, edita y publica. Adiós a escribir 3 horas 📰

Estudiantes: Graba la clase, transcribe, estudia. Es como tener apuntes automáticos (y gratis) 📚

Podcasters: Genera transcripciones para SEO, para que la gente te encuentre en Google. Más visitas = más dinero 💰

Editores de video: Transcribe, genera subtítulos, importa a CapCut. Todo en 5 minutos. Eres un dios 🎬


¿Te interesa el proyecto?

Descargar el codigo fuente

📥 Descargar